Lista taxonómica de referencia de mamíferos de Costa Rica
BiodataCR: plataforma para la gestión del conocimiento y la información sobre la biodiversidad de Costa Rica
Introducción
La lista taxonómica de referencia de mamíferos (clase Mammalia) de Costa Rica de BiodataCR permite integrar datos de diferentes publicadores en el sistema e implementar controles de calidad en aspectos como ortografía de los nombres científicos, sinonimia, nombres de autores y clasificación taxonómica, entre otros.
La siguiente tabla muestra las 257 especies de la lista. La columna Estado indica si el nombre científico es aceptado o un sinónimo. Con los controles de la tabla, puede modificar la cantidad de especies desplegadas, ordenar los datos y realizar búsquedas.
La lista está disponible para descarga en formato de valores separados por comas (CSV) en:
lista taxonómica de referencia de mamíferos de Costa Rica
El repositorio con los datos y el código fuente de los programas está en la dirección:
https://github.com/biodatacr/lista-taxonomica-referencia-mamíferos
En las siguientes secciones, se describe el proceso de elaboración de la lista y se presentan algunas visualizaciones de los datos que contiene.
Elaboración de la lista
El proceso inició con una lista de especies proporcionada por un grupo de expertos en mamíferos de Costa Rica, cuya estructura y formato se refinaron progresivamente para que los nombres científicos pudieran ser verificados en la lista taxonómica de referencia o Backbone Taxonomy de la Infraestructura Mundial de Información en Biodiversidad (GBIF), una organización dedicada a la integración de datos de biológicos de todo el mundo. El Backbone Taxonomy de GBIF se construye a partir del Catálogo de la Vida (COL), una lista integrada de nombres de especies de todos los grupos taxonómicos conocidos, y se completa con cerca de 100 fuentes adicionales de datos. Es actualizado periódicamente por medio de un proceso automático.
La verificación de los nombres científicos en el Backbone Taxonomy se llevó a cabo mediante un programa en el lenguaje R y su paquete rgbif. Este último proporciona acceso a los servicios web que componen la interfaz de programación de aplicaciones (API) de GBIF. Como resultado de esta verificación, se detectaron errores ortográficos, sinónimos, y se recuperaron elementos adicionales de datos, como autores y niveles taxonómicos superiores, entre otros.
Seguidamente, se describen en detalle las etapas del proceso de elaboración de la lista.
1. Lista inicial
La lista inicial contiene 257 especies de mamíferos de Costa Rica y fue recopilada en el contexto del proyecto Biodiversidad en cifras (Bermúdez Rojas, Tania & Obando Acuña, Vilma, 2021). El documento fue proporcionado en formato XLSX (Microsoft Excel).
2. Lista intermedia
Se removieron de la lista inicial aquellas filas que no corresponden a datos (ej. título, autor, fecha, etc.) y el resultado se guardó en formato CSV, como una lista intermedia. De esta manera, se obtuvo un conjunto de datos debidamente estructurado, con una fila por cada especie y una columna por cada elemento de datos.
Además, en la columna ESPECIE se cambió el nombre científico Spheothos venaticus (incorrecto) por Speothos venaticus (correcto). Este corrección debió realizarse en el siguiente paso, en el que se revisó programáticamente la ortografía de los nombres científicos con base en el Backbone Taxonomy de GBIF, pero el algoritmo no logró encontrar el nombre correcto para este caso, por lo que se corrigió manualmente.
3. Lista final
La lista intermedia generada en el paso anterior se utilizó como entrada del programa generar-lista-taxonomica.R, el cual, en resumen, ejecutó las siguientes tareas:
“Limpió” la columna
Especie(que contiene el nombre científico de la especie) al remover espacios en blanco innecesarios, caracteres especiales (i.e. no alfanuméricos) y palabras siguientes a la segunda (ej. autores), conservando así solamente las dos primeras palabras: género y epíteto específico (ej. Puma concolor). El resultado se guardó en una nueva columna llamadaname.Buscó los nombres científicos de la columna
nameen el Backbone Taxonomy de GBIF y para cada recuperó elementos de datos como:- Nombre científico (género + epíteto específico + autores).
- Niveles taxonómicos (reino, clase, …, familia, género, especie).
- Estado (aceptado, sinónimo).
- Exactitud de la búsqueda (exacta, difusa).
- Nivel de confianza de la búsqueda (0…99).
La lista final consta de los 257 nombres de especies de la lista original, revisados y corregidos, junto con los restantes elementos de datos recuperados del Backbone Taxonomy de GBIF.
Los elementos de datos (i.e. columnas) de la lista final están definidos de acuerdo con el Darwin Core (DwC), un estándar orientado a facilitar la publicación e integración de datos de biodiversidad, el cual incluye un glosario de términos comúnmente utilizados en listas de especies, registros de colecciones biológicas, observaciones de ciencia ciudadana y eventos de monitoreo, entre otras fuentes (Wieczorek et al., 2012).
La lista se empaqueta y distribuye en formato Darwin Core Archive (DwC-A), un archivo comprimido tipo ZIP que contiene archivos de datos en formato CSV y descriptores en formato XML. El DwC-A es el formato preferido para compartir datos en GBIF y en otras plataformas agrupadoras de datos de biodiversidad.
Visualización de los datos
En esta sección, se presentan algunas visualizaciones de las especies de la lista y de sus registros de presencia. Estos últimos fueron recuperados del portal de datos de GBIF.
Especies
Lista final e indicadores de la búsqueda de nombres
La siguiente tabla muestra las 257 especies de la lista final, junto con el nombre de cada especie en la lista inicial y las columnas correspondientes al nivel de exactitud (exacta, difusa) y nivel de confianza de la búsqueda (0…99).
Diferencias entre la lista inicial y la lista final
La siguiente tabla muestra las especies en las que hay alguna diferencia entre el nombre proporcionado en la lista inicial y el resultante en la lista final. Las diferencias se deben principalmente al uso de sinónimos y a errores ortográficos. A esta tabla debe agregarse el caso ya mencionado de Spheothos venaticus, nombre incorrecto en la lista inicial, el cual se sustituyó manualmente por Speothos venaticus, en la lista intermedia.
Cantidad de especies por orden y familia
El siguiente gráfico de barras muestra la cantida de especies de la lista en cada orden y familia.
Registros de presencia
Para contar con una aproximación de la cantidad de datos de presencia disponibles para cada una de las especies de la lista, se realizó una consulta al portal de datos de GBIF. Se encontraron 36292 registros de 230 de las 257 especies de la lista.
Cantidad de registros de presencia por especie
Especies en GBIF reportadas en Costa Rica y ausentes en la lista de referencia
Se realizó otra consulta al portal de datos de GBIF, de todos los registros de presencia de la clase Mammalia (todas las especies, no solo las de la lista de referencia), la cual retornó 43435 registros de 313 especies.
Las siguientes son las especies que retornó la consulta y que no están en la lista de referencia.
Mapa de distribución
El siguiente mapa muestra la distribución geográfica de los registros de presencia de las especies de la lista de referencia (puede que algunas no tengan registros). Se incluyó una capa para cada uno de los órdenes taxonómicos, las cuales pueden activarse y desactivarse con el control de capas. Al hacer clic sobre cada punto, pueden observarse algunos elementos de datos del registro de presencia correspondiente.